Korpuszok dokumentációja
Az elemzésekhez generált alkorpuszokat a ráolvasás-adatbázis építéséhez használt Excel-táblázatból nyertük ki, majd .tsv formátumban mentettünk el. 
Egy-egy kiválasztott (forrástípus, gyűjtő vagy dátum szerinti) alkorpusz esetében többféle állományt generáltunk. A fájlnevekben használt ’rekord’ azt jelenti, hogy a teljes ráolvasásrekord szerepel a mentésben, tehát a tulajdonképpeni ráolvasásszövegen túl a cím, az esetleges gyűjtői kérdés / adatközlői magyarázat, rítus és gesztusmagyarázatok is bekerültek ilyenkor az elemzésbe. A ’beszédaktus’ jelölésű fájlok esetében azon csak pusztán a ráolvasások tényleges formuláit tartalmazza a korpusz. A ’rítus’ jelölés arra vonatkozik, hogy csak a ráolvasásadathoz tartozó, magyar köznyelvi nyelven megfogalmazott rítusmagyarázatokat tartalmazza az adott fájl. 
Az ’atlaszos adatok nélkül’ az MNA (Magyar néprajzi atlasz), MNT (Magyar néphit topográfiája) és SZMNA (Szolnok megye néprajzi atlasz) gyűjtései során keletkezett adatok nélküli adatsort jelöl. Takács György gyűjtései esetében generáltunk román nyelvi szövegek nélküli állományt is, ennek jelölése: ’roman nyelvu nelkul’. 
A fájlnevek legvégén szereplő számok darabszámot jelölnek, tehát az adott szempontú alkorpusz összesen annyi rekordot tartalmaz. 
A korpuszokon belül az adatok kronológiai sorrendben követik egymást. 
